본문 바로가기

▶ 자연과학/▷ 통계학

【통계학】 14-8강. Cochran-Mantel-Haenszel (CMH) 검정 14-8강. Cochran-Mantel-Haenszel (CMH) 검정 추천글 : 【통계학】 14강. 통계적 검정 1. 개요 [본문]2. 유도 [본문]3. 해석 [본문] 1. 개요 [목차]⑴ 정의 : 두 변수 X와 Y 사이의 관계를 제3 변수로 계층화한 경우 더 잘 설명되는지를 통계적으로 검정하는 방법⑵ 귀무가설 H0 : 계층이 주어져 있을 때 X와 Y의 상관관계가 계층이 주어지지 않았을 때와 차이가 나지 않음 (조건부 독립)⑶ 예를 들어, 치료와 반응 사이의 상관관계를 나이에 따라 계층적으로 구분하여 설명하는 게 더 유의한지를 검정할 수 있음 ⑷ 계층(stratum)은 범주형 데이터를 원칙으로 하며, 연속형 데이터도 구간화하면 적용할 수 있음    2. 유도 [목차]⑴ (X, Y)가 N개의 순서쌍 관측..
【통계학】 18강. 회귀분석의 정규화 18강. 회귀분석의 정규화(regularization, penalization) 추천글 : 【통계학】 통계학 목차 1. 개요 [본문]2. MSPE [본문]3. 기법 1. Ridge regression [본문]4. 기법 2. Lasso regression [본문]5. 기법 3. 엘라스틱 넷 [본문]6. 기법 4. SelectFromModel [본문]  1. 개요 [목차]⑴ 회귀분석의 문제점 : 주로 회귀변수가 굉장히 많은 경우에서 두드러짐  ① 다중공선성(multicollinearity)② 언더피팅(underfitting) : 모델이 flexibity가 떨어져서 주어진 데이터를 제대로 학습하지 못하는 것③ 오버피팅(overffiting)○ 평범한 회귀분석인 OLS 추정을 하는 경우 표본의 부정확성을 학습하..
【통계학】 21강. 정보이론 21강. 정보이론(information theory) 추천글 : 【통계학】 통계학 목차 1. 정보이론 [본문]2. 변분추론 [본문]3. 현대 정보이론 [본문] 1. 정보이론 [목차]⑴ 개요① low probability event : high information (surprising) ② high probability event : low information (unsurprising)⑵ entropy① 문제 상황 : X는 Raining / Not Raining. Y는 Cloudy / Not Cloudy Figure. 1. 엔트로피 예제 ② 통계학 기본 개념  ③ 정보(information) : 결과를 알게 되었을 때 얻게 되는 모든 것④ uncertainty(surprisal, unexpectedne..
【통계학】 통계학 목차 통계학 목차 추천글 : 【수학】 수학 목차 최근 수정 내역Cochran-Mantel-Haenszel 검정 (24.10.14)회귀분석의 정규화 목차 추가 (24.10.09)norm과 거리함수 (24.10.07)  전하는 말 Ⅰ. 조합론1강. 통계의 기초1-1강. 분위수 대 분위수 플롯2강. 경우의 수 Ⅱ. 모집단3강. 확률공간3-1강. 포함배제의 원리3-2강. 몬티홀 문제  3-3강. 고난이도 확률문제 4강. 확률변수와 분포5강. 통계량5-1강. 거리함수와 유사도 6강. 이산확률분포7강. 연속확률분포8강. 확률변수변환9강. 통계학 주요 정리 1부10강. 통계학 주요 정리 2부 Ⅲ. 표본집단11강. 표본집단과 표본분포12강. 오차해석13강. 통계적 추정14강. 통계적 검정14-1강. 통계적 검정 예시 총정리..
【통계학】 우도비 검정과 Wilks’ phenomenon 증명 우도비 검정과 Wilks’ phenomenon 증명 추천글 : 【통계학】 14강. 통계적 검정 1. 정리 [본문]2. 증명 [본문]3. 예제 [본문] 1. 정리 [목차]⑴ 우도비 검정(likelihood ratio test) : 귀무가설 H0 : θ = θ0, 대립가설 H1 : θ ≠ θ0가 주어져 있을 때, 귀무가설 H0를 기각하는 조건, 즉 기각역을 다음과 같이 설정할 수 있음 (단, ℒ는 우도함수)  ⑵ 일반화된 우도비 검정(generalized likelihood ratio test) : 우도비 검정에서 H0를 θ = θ0와 같이 단순 가설로밖에 정의할 수 없는 게 문제가 됨. 귀무가설 H0 : θ ∈ Θ0, 대립가설 H1 : θ ∉ Θ0와 같이 더 다채롭게 정의한 상황에 대하여 귀무가설 H0를 ..
【통계학】 Gromov-Wasserstein distance 이해하기 Gromov-Wasserstein distance(Kantorovich–Rubinstein metric, Earth Mover's Distance, EMD) 추천글 : 【통계학】 5-2강. 거리함수와 유사도 1. 개요 [본문]2. 코드 [본문] 1. 개요 [목차]⑴ 결합확률분포(결합확률질량함수, joint probability distribution; 커플링, coupling) ① 이산확률변수 : X ={x1, ···, xm}, Y ={y1, ···, yn}에 대해, π(xi, yj) = π(X = xi, Y = yj)인 함수 π(x, y) ② 연속확률변수 : ∂2F(x, y) / ∂x ∂y = π(x, y)인 함수 π(x, y) ③ 성질 1. π(x, y) ≥ 0 ④ 성질 2. ∑∑ π(x, y) = ..
【통계학】 5-2강. 거리함수와 유사도 5-2강. 거리함수와 유사도 추천글 : 【통계학】 5강. 통계량 1. 개요 [본문]2. 노음 개념 종류 [본문]3. 거리 개념 종류 [본문]4. 유사도 개념 종류 [본문]a. Gromov-Wasserstein distance ※ 일부 거리 개념과 유사도 개념이 잘못 분류됐을 수도 있습니다.  1. 개요 [목차]⑴ 노음과 거리의 차이 : 많이 혼용되어 쓰임① 노음(노름, norm)  ② 거리함수(distance function, metric)   ③ 노음이 정의되면 거리(distance) d를 정의할 수 있음  ④ 거리가 정의돼 있다고 하여 대응되는 노음이 항상 존재하는 것은 아님⑵ 거리와 유사도의 차이 : 많이 혼용되어 쓰임 ① 공통점 : 두 data point가 가깝다(거리가 짧다)는 말은 유사하다는 ..
【통계학】 14-5강. 런 검정(run test) 14-5강. 런 검정(run test) 추천글 : 【통계학】 14강. 통계적 검정 1. 개요 [본문] 2. 가정 [본문] 3. 절차 [본문] 1. 개요 [목차] ⑴ 두 개의 값을 가지는 연속적인 측정값들이 어떤 패턴이나 경향이 없이 임의적으로 나타난 것인지를 검정하는 방법 ⑵ 런(run)은 동일한 측정값들이 시작하여 끝날 때까지의 덩어리를 지칭 ① 예 : 1, 0, 0, 1, 0, 1, 1, 1, 0, 1과 같은 수열의 경우 1/00/1/0/111/0/1로 런은 총 7개 2. 가정 [목차] ⑴ 이분화된 자료가 아닌 경우는 이분화된 자료로 변환시켜야 함 ⑵ 평균, 중위수, 최빈수 또는 사용자가 정의한 숫자 등의 기준값을 이용하여 이분화 3. 절차 [목차] ⑴ 단계 1. 가설 검정 ① 귀무가설 H0 : 연속..